Telegram Group & Telegram Channel
πŸ”₯ Π—Π°Π΄Π°Ρ‡Π°: "ДинамичСская пСрСобучаСмая модСль с ограничСниями Π΄Π°Π½Π½Ρ‹Ρ…"

β–ͺ️ УсловиС Π·Π°Π΄Π°Ρ‡ΠΈ:


Π’Π°ΠΌ Π½Π΅ΠΎΠ±Ρ…ΠΎΠ΄ΠΈΠΌΠΎ Ρ€Π°Π·Ρ€Π°Π±ΠΎΡ‚Π°Ρ‚ΡŒ систСму машинного обучСния для ΠΎΠ½Π»Π°ΠΉΠ½-Ρ€Π΅ΠΊΠΎΠΌΠ΅Π½Π΄Π°Ρ†ΠΈΠΉ, которая Ρ€Π°Π±ΠΎΡ‚Π°Π΅Ρ‚ Π² Ρ€Π΅Π°Π»ΡŒΠ½ΠΎΠΌ Π²Ρ€Π΅ΠΌΠ΅Π½ΠΈ. Π”Π°Π½Π½Ρ‹Π΅ ΠΏΠΎΡΡ‚ΡƒΠΏΠ°ΡŽΡ‚ Π½Π΅ΠΏΡ€Π΅Ρ€Ρ‹Π²Π½Ρ‹ΠΌ ΠΏΠΎΡ‚ΠΎΠΊΠΎΠΌ Π² Π²ΠΈΠ΄Π΅ ΠΏΠΎΠ»ΡŒΠ·ΠΎΠ²Π°Ρ‚Π΅Π»ΡŒΡΠΊΠΈΡ… дСйствий.

Π”Π°Π½ΠΎ:

- ΠŸΠΎΡ‚ΠΎΠΊ событий Π²ΠΈΠ΄Π°:

{
"user_id": "string",
"event_type": "click" | "view" | "purchase",
"item_id": "string",
"timestamp": "ISO 8601",
"features": {
"device_type": "mobile" | "desktop",
"location": "string",
"time_of_day": "morning" | "afternoon" | "evening" | "night",
"category": "string"
}
}


ВрСбования:

1. ΠŸΠΎΡΡ‚Ρ€ΠΎΠΈΡ‚ΡŒ модСль, которая:
- ΠŸΡ€Π΅Π΄ΡΠΊΠ°Π·Ρ‹Π²Π°Π΅Ρ‚ Π²Π΅Ρ€ΠΎΡΡ‚Π½ΠΎΡΡ‚ΡŒ ΠΏΠΎΠΊΡƒΠΏΠΊΠΈ (`purchase`) ΠΏΠΎ ΡΠΎΠ±Ρ‹Ρ‚ΠΈΡŽ view.
- МодСль Π΄ΠΎΠ»ΠΆΠ½Π° динамичСски ΠΎΠ±Π½ΠΎΠ²Π»ΡΡ‚ΡŒΡΡ ΠΏΡ€ΠΈ поступлСнии Π½ΠΎΠ²Ρ‹Ρ… Π΄Π°Π½Π½Ρ‹Ρ… Π±Π΅Π· ΠΏΠΎΠ»Π½ΠΎΠ³ΠΎ пСрСобучСния с нуля.
- ΠŸΡ€ΠΈ этом историчСскиС Π΄Π°Π½Π½Ρ‹Π΅ ΡƒΠ΄Π°Π»ΡΡŽΡ‚ΡΡ Ρ‡Π΅Ρ€Π΅Π· 24 часа (Π΄Π°Π½Π½Ρ‹Π΅ "ΠΆΠΈΠ²ΡƒΡ‚" Ρ‚ΠΎΠ»ΡŒΠΊΠΎ сутки).

2. Π’Π½Π΅Π΄Ρ€ΠΈΡ‚ΡŒ ΠΌΠ΅Ρ…Π°Π½ΠΈΠ·ΠΌ:
- ΠžΠ±Π½Π°Ρ€ΡƒΠΆΠ΅Π½ΠΈΡ Π΄Ρ€Π΅ΠΉΡ„Π° Π΄Π°Π½Π½Ρ‹Ρ… Π±Π΅Π· доступа ΠΊ старым Π΄Π°Π½Π½Ρ‹ΠΌ.
- АвтоматичСского пСрСзапуска пСрСобучСния ΠΌΠΎΠ΄Π΅Π»ΠΈ ΠΏΡ€ΠΈ ΠΎΠ±Π½Π°Ρ€ΡƒΠΆΠ΅Π½ΠΈΠΈ сущСствСнного Π΄Ρ€Π΅ΠΉΡ„Π°.

3. ΠžΠ³Ρ€Π°Π½ΠΈΡ‡Π΅Π½ΠΈΡ:
- Π’Ρ‹ Π½Π΅ ΠΌΠΎΠΆΠ΅Ρ‚Π΅ Ρ…Ρ€Π°Π½ΠΈΡ‚ΡŒ Π±ΠΎΠ»Π΅Π΅ 1 ΠΌΠΈΠ»Π»ΠΈΠΎΠ½Π° событий Π² ΠΎΠΏΠ΅Ρ€Π°Ρ‚ΠΈΠ²Π½ΠΎΠΉ памяти.
- Latency прСдсказания ΠΌΠΎΠ΄Π΅Π»ΠΈ β€” Π½Π΅ Π±ΠΎΠ»Π΅Π΅ 100 миллисСкунд.

---

β–ͺ️ ## Подсказки:

- ΠŸΠΎΠ΄ΡƒΠΌΠ°ΠΉΡ‚Π΅ ΠΏΡ€ΠΎ использованиС on-line learning ΠΌΠΎΠ΄Π΅Π»Π΅ΠΉ (Π½Π°ΠΏΡ€ΠΈΠΌΠ΅Ρ€, SGDClassifier с partial_fit Π² sklearn, ΠΈΠ»ΠΈ свои Ρ€Π΅Π°Π»ΠΈΠ·Π°Ρ†ΠΈΠΈ).
- Для отслСТивания Π΄Ρ€Π΅ΠΉΡ„Π° Π±Π΅Π· хранСния ΠΏΠΎΠ»Π½Ρ‹Ρ… Π΄Π°Π½Π½Ρ‹Ρ… ΠΌΠΎΠΆΠ½ΠΎ ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΠΎΠ²Π°Ρ‚ΡŒ:
- Бтатистики ΠΏΠΎ ΠΏΡ€ΠΈΠ·Π½Π°ΠΊΠ°ΠΌ (ΡΠΊΠΎΠ»ΡŒΠ·ΡΡ‰ΠΈΠ΅ ΠΎΠΊΠ½Π°, гистограммы, PSI / KL-Π΄ΠΈΠ²Π΅Ρ€Π³Π΅Π½Ρ†ΠΈΡŽ).
- ΠœΠΎΠ½ΠΈΡ‚ΠΎΡ€ΠΈΠ½Π³ распрСдСлСний Ρ‡Π΅Ρ€Π΅Π· ΡΠΊΠΎΠ»ΡŒΠ·ΡΡ‰ΠΈΠ΅ ΠΌΠ΅Ρ‚Ρ€ΠΈΠΊΠΈ.
- Для Ρ€Π°Π±ΠΎΡ‚Ρ‹ Π² Ρ€Π΅Π°Π»ΡŒΠ½ΠΎΠΌ Π²Ρ€Π΅ΠΌΠ΅Π½ΠΈ ΠΏΠΎΠ΄ΡƒΠΌΠ°ΠΉΡ‚Π΅ ΠΎΠ± очСрСдях сообщСний ΠΈ микросСрвисной Π°Ρ€Ρ…ΠΈΡ‚Π΅ΠΊΡ‚ΡƒΡ€Π΅.
- Π’ΠΎΠ·ΠΌΠΎΠΆΠ½ΠΎ, стоит Ρ€Π°ΡΡΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ feature hashing для ΠΊΠ°Ρ‚Π΅Π³ΠΎΡ€ΠΈΠ°Π»ΡŒΠ½Ρ‹Ρ… ΠΏΡ€ΠΈΠ·Π½Π°ΠΊΠΎΠ², Ρ‡Ρ‚ΠΎΠ±Ρ‹ ΠΎΠ³Ρ€Π°Π½ΠΈΡ‡ΠΈΡ‚ΡŒ Ρ€Π°Π·ΠΌΠ΅Ρ€ пространства ΠΏΡ€ΠΈΠ·Π½Π°ΠΊΠΎΠ².

---

β–ͺ️ ## Π§Ρ‚ΠΎ оцСниваСтся:

- Π£ΠΌΠ΅Π½ΠΈΠ΅ Π²Ρ‹Π±ΠΈΡ€Π°Ρ‚ΡŒ ΠΏΡ€Π°Π²ΠΈΠ»ΡŒΠ½Ρ‹Π΅ ΠΌΠΎΠ΄Π΅Π»ΠΈ ΠΈ ΠΌΠ΅Ρ‚ΠΎΠ΄Ρ‹ обучСния ΠΏΠΎΠ΄ ограничСния Π·Π°Π΄Π°Ρ‡ΠΈ.
- Навыки построСния систСм с ΠΎΠ³Ρ€Π°Π½ΠΈΡ‡Π΅Π½ΠΈΠ΅ΠΌ ΠΏΠΎ памяти ΠΈ Π²Ρ€Π΅ΠΌΠ΅Π½ΠΈ ΠΎΡ‚Π²Π΅Ρ‚Π°.
- Π‘ΠΏΠΎΡΠΎΠ±Π½ΠΎΡΡ‚ΡŒ Π΄Π΅Ρ‚Π΅ΠΊΡ‚ΠΈΡ€ΠΎΠ²Π°Ρ‚ΡŒ Π΄Ρ€Π΅ΠΉΡ„ Π΄Π°Π½Π½Ρ‹Ρ… ΠΈ ΠΊΠΎΡ€Ρ€Π΅ΠΊΡ‚Π½ΠΎ Π½Π° Π½Π΅Π³ΠΎ Ρ€Π΅Π°Π³ΠΈΡ€ΠΎΠ²Π°Ρ‚ΡŒ.
- Чистота ΠΈ ΠΌΠ°ΡΡˆΡ‚Π°Π±ΠΈΡ€ΡƒΠ΅ΠΌΠΎΡΡ‚ΡŒ Π°Ρ€Ρ…ΠΈΡ‚Π΅ΠΊΡ‚ΡƒΡ€Ρ‹.
- ПониманиС особСнностСй ΠΏΡ€ΠΎΠ΄Π°ΠΊΡˆΠ½-ML систСм.

---

β–ͺ️ ## Π Π°Π·Π±ΠΎΡ€ Π²ΠΎΠ·ΠΌΠΎΠΆΠ½ΠΎΠ³ΠΎ Ρ€Π΅ΡˆΠ΅Π½ΠΈΡ:

**АрхитСктура Ρ€Π΅ΡˆΠ΅Π½ΠΈΡ:**

- Π˜ΡΠΏΠΎΠ»ΡŒΠ·ΠΎΠ²Π°Ρ‚ΡŒ ΠΎΠ½Π»Π°ΠΉΠ½-модСль (Π½Π°ΠΏΡ€ΠΈΠΌΠ΅Ρ€, SGDClassifier, Vowpal Wabbit, ΠΈΠ»ΠΈ свою Ρ€Π΅Π°Π»ΠΈΠ·Π°Ρ†ΠΈΡŽ логистичСской рСгрСссии).
- Для ΠΊΠ°Ρ‚Π΅Π³ΠΎΡ€ΠΈΠ°Π»ΡŒΠ½Ρ‹Ρ… ΠΏΡ€ΠΈΠ·Π½Π°ΠΊΠΎΠ² ΠΏΡ€ΠΈΠΌΠ΅Π½ΡΡ‚ΡŒ feature hashing (Ρ‡Ρ‚ΠΎΠ±Ρ‹ ΠΈΠ·Π±Π΅ΠΆΠ°Ρ‚ΡŒ роста количСства ΠΏΡ€ΠΈΠ·Π½Π°ΠΊΠΎΠ²).
- ΠŸΠΎΠ΄Π΄Π΅Ρ€ΠΆΠΈΠ²Π°Ρ‚ΡŒ "ΠΆΠΈΠ²ΠΎΠΉ" Ρ‚Ρ€Π΅Π½ΠΈΡ€ΠΎΠ²ΠΎΡ‡Π½Ρ‹ΠΉ Π±ΡƒΡ„Π΅Ρ€ Π² ΠΎΠΏΠ΅Ρ€Π°Ρ‚ΠΈΠ²Π½ΠΎΠΉ памяти:
- Π₯Ρ€Π°Π½ΠΈΡ‚ΡŒ послСдниС N событий (Π½Π°ΠΏΡ€ΠΈΠΌΠ΅Ρ€, 1 ΠΌΠΈΠ»Π»ΠΈΠΎΠ½) с рСгулярным ΡƒΠ΄Π°Π»Π΅Π½ΠΈΠ΅ΠΌ ΡƒΡΡ‚Π°Ρ€Π΅Π²ΡˆΠΈΡ… записСй (TTL).
- Для отслСТивания Π΄Ρ€Π΅ΠΉΡ„Π°:
- Π‘Π»Π΅Π΄ΠΈΡ‚ΡŒ Π·Π° срСдними значСниями ΠΈΠ»ΠΈ частотами ΠΊΠ°Ρ‚Π΅Π³ΠΎΡ€ΠΈΠΉ.
- ΠŸΡ€ΠΈ Ρ€Π΅Π·ΠΊΠΈΡ… измСнСниях β€” Ρ‚Ρ€ΠΈΠ³Π³Π΅Ρ€ΠΈΡ‚ΡŒ ΠΏΠ΅Ρ€Π΅ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅ ΠΌΠΎΠ΄Π΅Π»ΠΈ с нуля.

ΠŸΡ€ΠΎ Π²ΠΎΠ·ΠΌΠΎΠΆΠ½Ρ‹Π΅ слоТности:

- ΠžΠ±Ρ€Π°Π±ΠΎΡ‚ΠΊΠ° "Ρ…ΠΎΠ»ΠΎΠ΄Π½ΠΎΠ³ΠΎ старта" ΠΏΡ€ΠΈ ΠΈΠ½ΠΈΡ†ΠΈΠ°Π»ΠΈΠ·Π°Ρ†ΠΈΠΈ Π½ΠΎΠ²ΠΎΠΉ ΠΌΠΎΠ΄Π΅Π»ΠΈ Π±Π΅Π· большого объСма Π΄Π°Π½Π½Ρ‹Ρ….
- Как ΠΈΠ·Π±Π΅ΠΆΠ°Ρ‚ΡŒ пСрСобучСния Π½Π° ΡˆΡƒΠΌ ΠΏΡ€ΠΈ частом ΠΏΠ΅Ρ€Π΅ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ ΠΌΠΎΠ΄Π΅Π»ΠΈ.
- Баланс ΠΌΠ΅ΠΆΠ΄Ρƒ ΡΠΊΠΎΡ€ΠΎΡΡ‚ΡŒΡŽ Ρ€Π°Π±ΠΎΡ‚Ρ‹ ΠΈ качСством ΠΌΠΎΠ΄Π΅Π»ΠΈ ΠΏΡ€ΠΈ ΠΎΡ‡Π΅Π½ΡŒ частом ΠΎΠ±Π½ΠΎΠ²Π»Π΅Π½ΠΈΠΈ ΠΏΡ€ΠΈΠ·Π½Π°ΠΊΠΎΠ².

Π˜Π½ΡΡ‚Ρ€ΡƒΠΌΠ΅Π½Ρ‚Ρ‹, ΠΊΠΎΡ‚ΠΎΡ€Ρ‹Π΅ ΠΌΠΎΠ³ΡƒΡ‚ ΠΏΠΎΠΌΠΎΡ‡ΡŒ:

- Π‘ΠΊΠΎΠ»ΡŒΠ·ΡΡ‰ΠΈΠ΅ гистограммы для ΠΏΡ€ΠΈΠ·Π½Π°ΠΊΠΎΠ² (`histogram_sketching`).
- Feature hashing (`HashingVectorizer`, `FeatureHasher`).
- ΠœΠ΅Ρ…Π°Π½ΠΈΠ·ΠΌΡ‹ ΠΈΠ½ΠΊΡ€Π΅ΠΌΠ΅Π½Ρ‚Π°Π»ΡŒΠ½ΠΎΠ³ΠΎ обучСния (`partial_fit`, warm_start ΠΌΠΎΠ΄Π΅Π»ΠΈ).
- ΠœΠ΅Ρ‚Ρ€ΠΈΠΊΠΈ для ΠΌΠΎΠ½ΠΈΡ‚ΠΎΡ€ΠΈΠ½Π³Π° Π΄Ρ€Π΅ΠΉΡ„Π°: Population Stability Index (PSI), JS/ KL дивСргСнция.

Π”Π΅Π»ΠΈΡ‚Π΅ΡΡŒ Ρ€Π΅ΡˆΠ΅Π½ΠΈΠ΅ΠΌ Π² коммСнтариях πŸ‘‡

@machinelearning_interview

#собСсСдованиС #Π·Π°Π΄Π°Ρ‡Π° #ΠΌΠ°ΡˆΠΈΠ½Π½ΠΎΠ΅ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅
Please open Telegram to view this post
VIEW IN TELEGRAM



tg-me.com/machinelearning_interview/1772
Create:
Last Update:

πŸ”₯ Π—Π°Π΄Π°Ρ‡Π°: "ДинамичСская пСрСобучаСмая модСль с ограничСниями Π΄Π°Π½Π½Ρ‹Ρ…"

β–ͺ️ УсловиС Π·Π°Π΄Π°Ρ‡ΠΈ:


Π’Π°ΠΌ Π½Π΅ΠΎΠ±Ρ…ΠΎΠ΄ΠΈΠΌΠΎ Ρ€Π°Π·Ρ€Π°Π±ΠΎΡ‚Π°Ρ‚ΡŒ систСму машинного обучСния для ΠΎΠ½Π»Π°ΠΉΠ½-Ρ€Π΅ΠΊΠΎΠΌΠ΅Π½Π΄Π°Ρ†ΠΈΠΉ, которая Ρ€Π°Π±ΠΎΡ‚Π°Π΅Ρ‚ Π² Ρ€Π΅Π°Π»ΡŒΠ½ΠΎΠΌ Π²Ρ€Π΅ΠΌΠ΅Π½ΠΈ. Π”Π°Π½Π½Ρ‹Π΅ ΠΏΠΎΡΡ‚ΡƒΠΏΠ°ΡŽΡ‚ Π½Π΅ΠΏΡ€Π΅Ρ€Ρ‹Π²Π½Ρ‹ΠΌ ΠΏΠΎΡ‚ΠΎΠΊΠΎΠΌ Π² Π²ΠΈΠ΄Π΅ ΠΏΠΎΠ»ΡŒΠ·ΠΎΠ²Π°Ρ‚Π΅Π»ΡŒΡΠΊΠΈΡ… дСйствий.

Π”Π°Π½ΠΎ:

- ΠŸΠΎΡ‚ΠΎΠΊ событий Π²ΠΈΠ΄Π°:


{
"user_id": "string",
"event_type": "click" | "view" | "purchase",
"item_id": "string",
"timestamp": "ISO 8601",
"features": {
"device_type": "mobile" | "desktop",
"location": "string",
"time_of_day": "morning" | "afternoon" | "evening" | "night",
"category": "string"
}
}


ВрСбования:

1. ΠŸΠΎΡΡ‚Ρ€ΠΎΠΈΡ‚ΡŒ модСль, которая:
- ΠŸΡ€Π΅Π΄ΡΠΊΠ°Π·Ρ‹Π²Π°Π΅Ρ‚ Π²Π΅Ρ€ΠΎΡΡ‚Π½ΠΎΡΡ‚ΡŒ ΠΏΠΎΠΊΡƒΠΏΠΊΠΈ (`purchase`) ΠΏΠΎ ΡΠΎΠ±Ρ‹Ρ‚ΠΈΡŽ view.
- МодСль Π΄ΠΎΠ»ΠΆΠ½Π° динамичСски ΠΎΠ±Π½ΠΎΠ²Π»ΡΡ‚ΡŒΡΡ ΠΏΡ€ΠΈ поступлСнии Π½ΠΎΠ²Ρ‹Ρ… Π΄Π°Π½Π½Ρ‹Ρ… Π±Π΅Π· ΠΏΠΎΠ»Π½ΠΎΠ³ΠΎ пСрСобучСния с нуля.
- ΠŸΡ€ΠΈ этом историчСскиС Π΄Π°Π½Π½Ρ‹Π΅ ΡƒΠ΄Π°Π»ΡΡŽΡ‚ΡΡ Ρ‡Π΅Ρ€Π΅Π· 24 часа (Π΄Π°Π½Π½Ρ‹Π΅ "ΠΆΠΈΠ²ΡƒΡ‚" Ρ‚ΠΎΠ»ΡŒΠΊΠΎ сутки).

2. Π’Π½Π΅Π΄Ρ€ΠΈΡ‚ΡŒ ΠΌΠ΅Ρ…Π°Π½ΠΈΠ·ΠΌ:
- ΠžΠ±Π½Π°Ρ€ΡƒΠΆΠ΅Π½ΠΈΡ Π΄Ρ€Π΅ΠΉΡ„Π° Π΄Π°Π½Π½Ρ‹Ρ… Π±Π΅Π· доступа ΠΊ старым Π΄Π°Π½Π½Ρ‹ΠΌ.
- АвтоматичСского пСрСзапуска пСрСобучСния ΠΌΠΎΠ΄Π΅Π»ΠΈ ΠΏΡ€ΠΈ ΠΎΠ±Π½Π°Ρ€ΡƒΠΆΠ΅Π½ΠΈΠΈ сущСствСнного Π΄Ρ€Π΅ΠΉΡ„Π°.

3. ΠžΠ³Ρ€Π°Π½ΠΈΡ‡Π΅Π½ΠΈΡ:
- Π’Ρ‹ Π½Π΅ ΠΌΠΎΠΆΠ΅Ρ‚Π΅ Ρ…Ρ€Π°Π½ΠΈΡ‚ΡŒ Π±ΠΎΠ»Π΅Π΅ 1 ΠΌΠΈΠ»Π»ΠΈΠΎΠ½Π° событий Π² ΠΎΠΏΠ΅Ρ€Π°Ρ‚ΠΈΠ²Π½ΠΎΠΉ памяти.
- Latency прСдсказания ΠΌΠΎΠ΄Π΅Π»ΠΈ β€” Π½Π΅ Π±ΠΎΠ»Π΅Π΅ 100 миллисСкунд.

---

β–ͺ️ ## Подсказки:

- ΠŸΠΎΠ΄ΡƒΠΌΠ°ΠΉΡ‚Π΅ ΠΏΡ€ΠΎ использованиС on-line learning ΠΌΠΎΠ΄Π΅Π»Π΅ΠΉ (Π½Π°ΠΏΡ€ΠΈΠΌΠ΅Ρ€, SGDClassifier с partial_fit Π² sklearn, ΠΈΠ»ΠΈ свои Ρ€Π΅Π°Π»ΠΈΠ·Π°Ρ†ΠΈΠΈ).
- Для отслСТивания Π΄Ρ€Π΅ΠΉΡ„Π° Π±Π΅Π· хранСния ΠΏΠΎΠ»Π½Ρ‹Ρ… Π΄Π°Π½Π½Ρ‹Ρ… ΠΌΠΎΠΆΠ½ΠΎ ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΠΎΠ²Π°Ρ‚ΡŒ:
- Бтатистики ΠΏΠΎ ΠΏΡ€ΠΈΠ·Π½Π°ΠΊΠ°ΠΌ (ΡΠΊΠΎΠ»ΡŒΠ·ΡΡ‰ΠΈΠ΅ ΠΎΠΊΠ½Π°, гистограммы, PSI / KL-Π΄ΠΈΠ²Π΅Ρ€Π³Π΅Π½Ρ†ΠΈΡŽ).
- ΠœΠΎΠ½ΠΈΡ‚ΠΎΡ€ΠΈΠ½Π³ распрСдСлСний Ρ‡Π΅Ρ€Π΅Π· ΡΠΊΠΎΠ»ΡŒΠ·ΡΡ‰ΠΈΠ΅ ΠΌΠ΅Ρ‚Ρ€ΠΈΠΊΠΈ.
- Для Ρ€Π°Π±ΠΎΡ‚Ρ‹ Π² Ρ€Π΅Π°Π»ΡŒΠ½ΠΎΠΌ Π²Ρ€Π΅ΠΌΠ΅Π½ΠΈ ΠΏΠΎΠ΄ΡƒΠΌΠ°ΠΉΡ‚Π΅ ΠΎΠ± очСрСдях сообщСний ΠΈ микросСрвисной Π°Ρ€Ρ…ΠΈΡ‚Π΅ΠΊΡ‚ΡƒΡ€Π΅.
- Π’ΠΎΠ·ΠΌΠΎΠΆΠ½ΠΎ, стоит Ρ€Π°ΡΡΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ feature hashing для ΠΊΠ°Ρ‚Π΅Π³ΠΎΡ€ΠΈΠ°Π»ΡŒΠ½Ρ‹Ρ… ΠΏΡ€ΠΈΠ·Π½Π°ΠΊΠΎΠ², Ρ‡Ρ‚ΠΎΠ±Ρ‹ ΠΎΠ³Ρ€Π°Π½ΠΈΡ‡ΠΈΡ‚ΡŒ Ρ€Π°Π·ΠΌΠ΅Ρ€ пространства ΠΏΡ€ΠΈΠ·Π½Π°ΠΊΠΎΠ².

---

β–ͺ️ ## Π§Ρ‚ΠΎ оцСниваСтся:

- Π£ΠΌΠ΅Π½ΠΈΠ΅ Π²Ρ‹Π±ΠΈΡ€Π°Ρ‚ΡŒ ΠΏΡ€Π°Π²ΠΈΠ»ΡŒΠ½Ρ‹Π΅ ΠΌΠΎΠ΄Π΅Π»ΠΈ ΠΈ ΠΌΠ΅Ρ‚ΠΎΠ΄Ρ‹ обучСния ΠΏΠΎΠ΄ ограничСния Π·Π°Π΄Π°Ρ‡ΠΈ.
- Навыки построСния систСм с ΠΎΠ³Ρ€Π°Π½ΠΈΡ‡Π΅Π½ΠΈΠ΅ΠΌ ΠΏΠΎ памяти ΠΈ Π²Ρ€Π΅ΠΌΠ΅Π½ΠΈ ΠΎΡ‚Π²Π΅Ρ‚Π°.
- Π‘ΠΏΠΎΡΠΎΠ±Π½ΠΎΡΡ‚ΡŒ Π΄Π΅Ρ‚Π΅ΠΊΡ‚ΠΈΡ€ΠΎΠ²Π°Ρ‚ΡŒ Π΄Ρ€Π΅ΠΉΡ„ Π΄Π°Π½Π½Ρ‹Ρ… ΠΈ ΠΊΠΎΡ€Ρ€Π΅ΠΊΡ‚Π½ΠΎ Π½Π° Π½Π΅Π³ΠΎ Ρ€Π΅Π°Π³ΠΈΡ€ΠΎΠ²Π°Ρ‚ΡŒ.
- Чистота ΠΈ ΠΌΠ°ΡΡˆΡ‚Π°Π±ΠΈΡ€ΡƒΠ΅ΠΌΠΎΡΡ‚ΡŒ Π°Ρ€Ρ…ΠΈΡ‚Π΅ΠΊΡ‚ΡƒΡ€Ρ‹.
- ПониманиС особСнностСй ΠΏΡ€ΠΎΠ΄Π°ΠΊΡˆΠ½-ML систСм.

---

β–ͺ️ ## Π Π°Π·Π±ΠΎΡ€ Π²ΠΎΠ·ΠΌΠΎΠΆΠ½ΠΎΠ³ΠΎ Ρ€Π΅ΡˆΠ΅Π½ΠΈΡ:

**АрхитСктура Ρ€Π΅ΡˆΠ΅Π½ΠΈΡ:**

- Π˜ΡΠΏΠΎΠ»ΡŒΠ·ΠΎΠ²Π°Ρ‚ΡŒ ΠΎΠ½Π»Π°ΠΉΠ½-модСль (Π½Π°ΠΏΡ€ΠΈΠΌΠ΅Ρ€, SGDClassifier, Vowpal Wabbit, ΠΈΠ»ΠΈ свою Ρ€Π΅Π°Π»ΠΈΠ·Π°Ρ†ΠΈΡŽ логистичСской рСгрСссии).
- Для ΠΊΠ°Ρ‚Π΅Π³ΠΎΡ€ΠΈΠ°Π»ΡŒΠ½Ρ‹Ρ… ΠΏΡ€ΠΈΠ·Π½Π°ΠΊΠΎΠ² ΠΏΡ€ΠΈΠΌΠ΅Π½ΡΡ‚ΡŒ feature hashing (Ρ‡Ρ‚ΠΎΠ±Ρ‹ ΠΈΠ·Π±Π΅ΠΆΠ°Ρ‚ΡŒ роста количСства ΠΏΡ€ΠΈΠ·Π½Π°ΠΊΠΎΠ²).
- ΠŸΠΎΠ΄Π΄Π΅Ρ€ΠΆΠΈΠ²Π°Ρ‚ΡŒ "ΠΆΠΈΠ²ΠΎΠΉ" Ρ‚Ρ€Π΅Π½ΠΈΡ€ΠΎΠ²ΠΎΡ‡Π½Ρ‹ΠΉ Π±ΡƒΡ„Π΅Ρ€ Π² ΠΎΠΏΠ΅Ρ€Π°Ρ‚ΠΈΠ²Π½ΠΎΠΉ памяти:
- Π₯Ρ€Π°Π½ΠΈΡ‚ΡŒ послСдниС N событий (Π½Π°ΠΏΡ€ΠΈΠΌΠ΅Ρ€, 1 ΠΌΠΈΠ»Π»ΠΈΠΎΠ½) с рСгулярным ΡƒΠ΄Π°Π»Π΅Π½ΠΈΠ΅ΠΌ ΡƒΡΡ‚Π°Ρ€Π΅Π²ΡˆΠΈΡ… записСй (TTL).
- Для отслСТивания Π΄Ρ€Π΅ΠΉΡ„Π°:
- Π‘Π»Π΅Π΄ΠΈΡ‚ΡŒ Π·Π° срСдними значСниями ΠΈΠ»ΠΈ частотами ΠΊΠ°Ρ‚Π΅Π³ΠΎΡ€ΠΈΠΉ.
- ΠŸΡ€ΠΈ Ρ€Π΅Π·ΠΊΠΈΡ… измСнСниях β€” Ρ‚Ρ€ΠΈΠ³Π³Π΅Ρ€ΠΈΡ‚ΡŒ ΠΏΠ΅Ρ€Π΅ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅ ΠΌΠΎΠ΄Π΅Π»ΠΈ с нуля.

ΠŸΡ€ΠΎ Π²ΠΎΠ·ΠΌΠΎΠΆΠ½Ρ‹Π΅ слоТности:

- ΠžΠ±Ρ€Π°Π±ΠΎΡ‚ΠΊΠ° "Ρ…ΠΎΠ»ΠΎΠ΄Π½ΠΎΠ³ΠΎ старта" ΠΏΡ€ΠΈ ΠΈΠ½ΠΈΡ†ΠΈΠ°Π»ΠΈΠ·Π°Ρ†ΠΈΠΈ Π½ΠΎΠ²ΠΎΠΉ ΠΌΠΎΠ΄Π΅Π»ΠΈ Π±Π΅Π· большого объСма Π΄Π°Π½Π½Ρ‹Ρ….
- Как ΠΈΠ·Π±Π΅ΠΆΠ°Ρ‚ΡŒ пСрСобучСния Π½Π° ΡˆΡƒΠΌ ΠΏΡ€ΠΈ частом ΠΏΠ΅Ρ€Π΅ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ ΠΌΠΎΠ΄Π΅Π»ΠΈ.
- Баланс ΠΌΠ΅ΠΆΠ΄Ρƒ ΡΠΊΠΎΡ€ΠΎΡΡ‚ΡŒΡŽ Ρ€Π°Π±ΠΎΡ‚Ρ‹ ΠΈ качСством ΠΌΠΎΠ΄Π΅Π»ΠΈ ΠΏΡ€ΠΈ ΠΎΡ‡Π΅Π½ΡŒ частом ΠΎΠ±Π½ΠΎΠ²Π»Π΅Π½ΠΈΠΈ ΠΏΡ€ΠΈΠ·Π½Π°ΠΊΠΎΠ².

Π˜Π½ΡΡ‚Ρ€ΡƒΠΌΠ΅Π½Ρ‚Ρ‹, ΠΊΠΎΡ‚ΠΎΡ€Ρ‹Π΅ ΠΌΠΎΠ³ΡƒΡ‚ ΠΏΠΎΠΌΠΎΡ‡ΡŒ:

- Π‘ΠΊΠΎΠ»ΡŒΠ·ΡΡ‰ΠΈΠ΅ гистограммы для ΠΏΡ€ΠΈΠ·Π½Π°ΠΊΠΎΠ² (`histogram_sketching`).
- Feature hashing (`HashingVectorizer`, `FeatureHasher`).
- ΠœΠ΅Ρ…Π°Π½ΠΈΠ·ΠΌΡ‹ ΠΈΠ½ΠΊΡ€Π΅ΠΌΠ΅Π½Ρ‚Π°Π»ΡŒΠ½ΠΎΠ³ΠΎ обучСния (`partial_fit`, warm_start ΠΌΠΎΠ΄Π΅Π»ΠΈ).
- ΠœΠ΅Ρ‚Ρ€ΠΈΠΊΠΈ для ΠΌΠΎΠ½ΠΈΡ‚ΠΎΡ€ΠΈΠ½Π³Π° Π΄Ρ€Π΅ΠΉΡ„Π°: Population Stability Index (PSI), JS/ KL дивСргСнция.

Π”Π΅Π»ΠΈΡ‚Π΅ΡΡŒ Ρ€Π΅ΡˆΠ΅Π½ΠΈΠ΅ΠΌ Π² коммСнтариях πŸ‘‡

@machinelearning_interview

#собСсСдованиС #Π·Π°Π΄Π°Ρ‡Π° #ΠΌΠ°ΡˆΠΈΠ½Π½ΠΎΠ΅ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅

BY Machine learning Interview


Warning: Undefined variable $i in /var/www/tg-me/post.php on line 283

Share with your friend now:
tg-me.com/machinelearning_interview/1772

View MORE
Open in Telegram


Machine learning Interview Telegram | DID YOU KNOW?

Date: |

Spiking bond yields driving sharp losses in tech stocks

A spike in interest rates since the start of the year has accelerated a rotation out of high-growth technology stocks and into value stocks poised to benefit from a reopening of the economy. The Nasdaq has fallen more than 10% over the past month as the Dow has soared to record highs, with a spike in the 10-year US Treasury yield acting as the main catalyst. It recently surged to a cycle high of more than 1.60% after starting the year below 1%. But according to Jim Paulsen, the Leuthold Group's chief investment strategist, rising interest rates do not represent a long-term threat to the stock market. Paulsen expects the 10-year yield to cross 2% by the end of the year. A spike in interest rates and its impact on the stock market depends on the economic backdrop, according to Paulsen. Rising interest rates amid a strengthening economy "may prove no challenge at all for stocks," Paulsen said.

How Does Telegram Make Money?

Telegram is a free app and runs on donations. According to a blog on the telegram: We believe in fast and secure messaging that is also 100% free. Pavel Durov, who shares our vision, supplied Telegram with a generous donation, so we have quite enough money for the time being. If Telegram runs out, we will introduce non-essential paid options to support the infrastructure and finance developer salaries. But making profits will never be an end-goal for Telegram.

Machine learning Interview from jp


Telegram Machine learning Interview
FROM USA